查看原文
其他

“汉语助研”操作指南与案例二:例句检索

语言科技 语言科技 2022-12-05




PART.1



句检索功能






在自建语料库或其他大型语料库中,想要进行单个词或多个词的具体例句检索,就需要借助到例句检索功能


汉语助研的例句检索功能,可以对任意语料库进行“单个词检索”或“多词组合检索”,并将检索结果清晰地展示出来,以辅助汉语研究与汉语教学。








PART.2



例句检索功能的使用



下面详细介绍如何使用汉语助研软件的例句检索功能。




PART.3



例句检索功能的步骤


步骤一:打开语料库文件夹


在“检索”模块下,点击“打开”按钮,打开语料库所在的文件夹。(E://金庸小说)


也可以直接将语料库文件夹路径复制粘贴到后面的文本框中


语料库是以文本文件形式(txt格式)存储的自建语料,一篇文章保存为一个文件,可以层级文件夹存放,语料一般只包含标题和正文,格式、编码不限。


注意:软件打开语料库时,会按照“。?!…”对语料进行分句。因此,所有检索都应限定在句内进行。



步骤二:设置保存路径


点击“保存”按钮,设置好例句检索结果保存的文件夹路径,也可直接输入保存文件夹路径(不需要先建文件夹)。检索结果将保存在该文件夹中。



步骤三:选择检索模式


1.单个词检索 
对于“单个词检索”,我们既可以检索单个词,例如,输入“高兴”,点击“检索并保存例句”,会检索出语料库中所有出现“高兴”的例句。

单个词检索“高兴”的例句检索结果如下:


也可以一次性检索多个词,多个检索词之间用“|”(隔页符)隔开。检索出的多个词的例句,会存放在不同的文本文件中。
例如,输入“高兴|开心|兴奋”,点击“检索并保存例句”,会检索出语料库中所有出现“高兴”或“开心”或“兴奋”的例句。

多个词检索“高兴|开心|兴奋”的结果如下:


2.多词组合检索 
如果要检索多个词语,我们可以选择“双词组合检索”。
例如,输入“不但”“而且”,间距输入“12”,并选择“同出现”,可检索出“不但”后面12字之内同时出现“而且”的例句(“间距”表示两个词语之间的距离,即二者之间相隔的字数)。最后点击“检索并保存例句”。

多词组合检索,以“不但”“而且”为例,检索“不但”后面12字之内同时出现“而且”的例句,检索结果如下:


若间距输入“12”,并选择“不出现”,可检索出“不但”后面12字之内不出现“而且”的例句。

多词组合检索,以“不但”“而且”为例,检索“不但”后面12字之内不出现“而且”的例句,检索结果如下:


如果想检索出只出现“不但”不出现“而且”的例句,建议将间距设大一点,如50。最后点击“检索并保存例句”。

将间距设置为50后,检索结果如下:





PART.4



检索小技巧



当我们需要研究特定成分或词类时,例如,“要命”,我们只想要“要命”做补语的例句,但是在语料库检索时,会出现大量如“不要命、真要命、更要命”等作实词的例句。


这时候,我们可以输入“得要命”来检索,返回的例句就都是“要命”做补语的例句了。



同理,当需要检索“不堪”做补语的例句时,可以用“不堪+标点符号”或“不堪的/不堪地”来检索。






  该您来试试例句检索了  







            1 关注“语言科技”公众号2 后台回复“汉语助研”,免费下载正式版

后台回复“汉语助研”,免费获取正式版软件。


3 后台发送“例句检索”免费获取资源

后台发送“例句检索”,免费获取例句检索的大规模武侠小说语料库压缩包。

4 操作指南和研究案例分享

关注公众号推文,我们将陆续推出软件的使用操作视频以及典型案例。






图文/ 吕展   
视频/ 任德玲排版/ 陈伊彤初审/ 陈凯艺
审核/ 刘华  



 · END · 


    往    期    推    荐    




汉语助研——语料库建库统计一体化工具


“汉语助研”操作指南与案例一:建库语料库语言学——理论、工具与案例

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存